类似 automl 的特征字典
可以考虑维度
count:#card
- A_COUNT、B_COUNT、A_B_COUNT
nunique:#card
- A_nunqiue_B (按B对称的下文省略)
ratio:#card
- A_B_COUNT/A_COUNT 在A里各个B类所占的比例
average:#card
- A_COUNT/A_nunqiue_B A里各个B类的平均数
most:#card
- A_most_B 在A类里出现最高的B是哪个
pivot:#card
A_B1_count、A_B2_count A和B类里特定的B1、B2的联合统计
A_B1_count-A_B2_count A的B1行为和B2行为的加减乘除
stat1:#card
A_stat_A_B_COUNT 基于A_B_COUNT对A的描述,
A_stat_B_COUNT 基于B_COUNT对A的描述,
序列化:#card
初步LDA,NMF,SVD,
进一步Word2Vec,doc2vec
再进一步 图神经网络deepwalk,pPRoNE
类似 automl 的特征字典